Trong mô-đun này, chúng ta chuyển từ mô hình truyền thống dựa trên điều chỉnh trọng số sang thế giới động của Học trong Liên kết (ICL). Chúng ta khám phá cách các Mô hình Ngôn ngữ Lớn (LLM) đạt được thành thạo nhiệm vụ không phải bằng cách thay đổi kiến trúc nội bộ, mà bằng việc tận dụng cấu trúc của câu lệnh đầu vào để định hướng trong các không gian tiềm ẩn phức tạp.
1. Từ Nói Ra Sang Cho Xem
Trong khi một hướng dẫn chỉ cung cấp phương hướng chung, thì "bắt chước" thông qua các cặp đầu vào - đầu ra $(x, y)$ lại đóng vai trò như một hướng dẫn phi tham số. Những ví dụ này hoạt động như các điểm tham chiếu thống kê, giúp thu hẹp phân bố xác suất của mô hình, giảm thiểu sự mơ hồ vốn có trong các hướng dẫn ngôn ngữ tự nhiên nguyên bản.
2. Cơ Chế Của Sự Tập Trung
ICL dựa vào cơ chế chú ý của Transformer để thực hiện "phỏng đoán nhiệm vụ." Bằng cách nhận diện các quy luật trong chuỗi dữ liệu bạn cung cấp, mô hình xác định được một bản đồ chức năng cụ thể trong không gian nhiều chiều của nó, cho phép nó bắt chước phong cách và cấu trúc với độ chính xác cao.
Goal: Provide a three-exemplar few-shot prompt that teaches the model a specific "Concise Executive" style, rather than just a generic professional tone.
Adjectives like "Concise" are subjective and have broad probability distributions; examples provide a concrete structural template that the attention mechanism can emulate with mathematical precision.